

# Instituto de Computação UNIVERSIDADE ESTADUAL DE CAMPINAS



# Organização Básica de computadores e linguagem de montagem

Introdução à arquitetura RV32

**Prof. Edson Borin** 

https://www.ic.unicamp.br/~edson

Institute of Computing - UNICAMP

#### RISC-V

#### ISA (Instruction Set Architecture) RISC moderna

Introduzida em 2011

ISA aberta! (uso livre e livre de royalties)

Funcionalidades e características desenvolvidas com base nos acertos e erros de ISAs que já estão no mercado há mais de 30 anos! (x86 e ARM)

- Mais simples do que ARM e x86
- Veja figura 2.7 do livro "Guia Prático RISC-V: Atlas de uma arquitetura aberta"

#### RISC-V

#### Mais simples do que ARM e x86

Tamanho relativo de programas do *benchmark* SPEC CPU2006 compilados com o GCC.



#### RISC-V

#### Mantida atualmente pela Fundação RISC-V

www.riscv.org

Fundação aberta e sem fins lucrativos

Mais de 325 empresas parceiras!

| >\$50B    |       | >\$5B, <        | \$50B       | >\$0.5B, <\$5B          |        |  |  |
|-----------|-------|-----------------|-------------|-------------------------|--------|--|--|
| Google    | USA   | BAE Systems     | UK          | AMD                     | USA    |  |  |
| Huawei    | China | MediaTek        | Taiwan      | Andes Technology        | China  |  |  |
| IBM       | USA   | Micron Tech.    | USA         | C-SKY Microsystems      | China  |  |  |
| Microsoft | USA   | Nvidia          | USA         | Integrated Device Tech. | USA    |  |  |
| Samsung   | Korea | NXP Semi.       | Netherlands | Mellanox Technology     | Israel |  |  |
|           |       | Qualcomm        | USA         | Microsemi Corp.         | USA    |  |  |
|           |       | Western Digital | USA         |                         |        |  |  |

Alguns dos maiores membros corporativos da Fundação RISC-V (Sexto Workshop RISC-V em maio de 2017

#### Arquitetura von Neumann





#### Memória endereçada a bytes

- Cada palavra de memória armazena I byte
- Tipos de dados maiores do que 1 byte ocupam múltiplas palavras de memória, consecutivas.



#### Diversos conjuntos de instruções:

- RV32I: Conjunto base de 32 bits com instruções para operações com números inteiros.
- RV32M: Instruções de multiplicação e divisão
- RV32F e RV32D: Instruções de ponto-flutuante
- RV32A: Instruções atômicas
- RV32C: Instruções compactas, de 16 bits
- RV32V: Instruções vetoriais (SIMD)

Neste curso focaremos no conjunto RV32IM

- Conjunto base de 32 bits + instruções para multiplicação e divisão de números inteiros
- Instruções de movimentação de dados (*load* e *store*), operações lógicas e aritméticas, comparação de valores, saltos condicionais e saltos incondicionais, chamadas de funções, ...

#### Tipos básicos de dados da arquitetura

- byte: I byte
- unsigned byte: I byte (sem sinal)
- halfword: 2 bytes
- unsigned halfword: 2 bytes (sem sinal)
- word: 4 bytes
- unsigned word: 4 bytes (sem sinal)

Mapeamento de tipos da linguagem `C' para tipos básicos de dados na arquitetura RV32

| U              | V                 | T        |  |
|----------------|-------------------|----------|--|
| $\mathbf{C}$   | RV32I native      | size     |  |
| datatype       | datatype          | in bytes |  |
| bool           | byte              | 1        |  |
| char           | byte              | 1        |  |
| unsigned char  | unsigned byte     | 1        |  |
| short          | halfword          | 2        |  |
| unsigned short | unsigned halfword | 2        |  |
| int            | word              | 4        |  |
| unsigned int   | unsigned word     | 4        |  |
| long           | word              | 4        |  |
| unsigned long  | unsigned word     | 4        |  |
| void*          | unsigned word     | 4        |  |
|                |                   |          |  |

Registradores



#### Registradores

PC

| x0 | хI | x2 | <b>x</b> 3 | x4 | x5  | x6 | x7  | x8  | x9 | xI0 | xII | xI2 | xI3  | xI4 | xI5 |
|----|----|----|------------|----|-----|----|-----|-----|----|-----|-----|-----|------|-----|-----|
|    |    |    |            |    |     |    |     |     |    |     |     |     |      |     |     |
|    | 17 | 10 | 10         | 20 | 2.1 | 22 | 2.2 | 2.4 | 25 | 27  | 27  | x28 | - 20 | 20  | 2.1 |

#### Registradores



#### Registradores

| Apelido | Significado                              |
|---------|------------------------------------------|
| рс      | Program Counter (Apontador de programa)  |
| a0,a1   | Argumentos de função / retorno de função |
| a2-a7   | Argumentos de função                     |
| s0-s11  | Registrador salvo                        |
| t0-t6   | Temporário                               |
| zero    | Contém sempre o valor 0 (zero)           |
| ra      | Endereço de retorno                      |
| sp      | Ponteiro de pilha                        |
| gp      | Ponteiro global                          |
| tp      | Ponteiro de thread                       |

**Arquitetura Load/Store**: Os valores têm que ser carregados nos registradores antes de realizar-se operações.

 Não há instruções que operam diretamente em valores na memória!

```
lw a5, 0(a0) # a5 <= Mem[a0]
add a6, a5, a5 # a6 <= a5+a5
sw a6, 0(a0) # Mem[a0] <= a6</pre>
```

#### **Arquitetura Load/Store**



#### Memória

| Valor |     |
|-------|-----|
| 06    | 0   |
| 00    | I   |
| 00    | 2   |
| 00    | 3   |
| 00    | 4   |
| 00    | 5   |
| 00    | 6   |
| 00    | 7   |
| •••   | ••• |

#### **Arquitetura Load/Store**



 $\frac{1w}{a5}$ ,  $\frac{(a0)}{a0}$  add a6, a5, a5 sw a6, (a1)

#### Memória



#### **Arquitetura Load/Store**



#### Memória

| Valor |     |
|-------|-----|
| 06    | 0   |
| 00    |     |
| 00    | 2   |
| 00    | 3   |
| 00    | 4   |
| 00    | 5   |
| 00    | 6   |
| 00    | 7   |
| •••   | ••• |



### Instruções: Operações Lógicas

Instruções que realizam operações lógicas (e, ou, ou exclusivo)

```
Formato: <MNE> rd, rs1, rs2
```

- and a0, a2, s2 # a0 <= a2 & s2</pre>
- or a1, a3, s2 # a1 <= a3 s2
- xor a2, a2, a1 # a2 <= a2 ^ a1</pre>

#### Formato: <MNE>i rd, rs1, imm

- andi a0, a2, 3 # a0 <= a2 & 3
- ori a1, a3, 4 # a1 <= a3 | 4</pre>
- xori a2, a2, 1 # a2 <= a2 ^ 1</pre>

Instruções que deslocam os *bits* dos registradores para a esquerda ou para direita.

```
Formato: <MNE>i rd, rs1, shamt

• slli a0, a2, 2 # a0 <= a2 << 2
• srli a1, a3, 1 # a1 <= a3 >> 1

• srai a2, a2, 1 # a2 <= a2 >>* 1

# *aritmético
```

OBS: Podem ser utilizadas para multiplicar/dividir por potências de 2.

Multiplicando com instruções de deslocamento de bits

Multiplicar um número inteiro com (int) ou sem sinal (unsigned) por potência de 2:

- slli a0, a2, 2 # a0 <= a2 \* 2<sup>2</sup>
- slli a3, a3, 4 # a3 <= a3 \* 2<sup>4</sup>

OBS: Basta deslocar os bits para a esquerda.

Dividindo com instruções de deslocamento de bits

Dividir um número inteiro sem sinal (unsigned) por potência de 2:

• srli a0, a2, 2 # a0 <= a2 /  $2^2$ 

Dividir um número inteiro com sinal (int) por potência de 2:

• srai a0, a2, 2 # a0 <= a2 /  $2^2$ 

OBS: Note a diferença entre a divisão de números inteiros com e sem sinal!

```
Formato: <MNE>i rd, rs1, shamt
• slli a0, a2, 2 # a0 <= a2 << 2
• srli a1, a3, 1 # a1 <= a3 >> 1
• srai a2, a2, 1 # a2 <= a2 >>* 1
# *aritmético
Formato: <MNE> rd, rs1, rs2
```

- sll a0, a2, **s2**
- srl a1, a3, **s2**
- sra a2, a2, **a1**

Deslocamento pode ser indicado por valor em registrador!

### Instruções: Operações Aritméticas

Instruções que realizam operações aritméticas (+, -, ...) com valores nos registradores

```
Formato: <MNE> rd, rs1, rs2

• add a0, a2, t2  # a0 <= a2 + t2

• sub a1, t3, a0  # a1 <= t3 - a0

• mul a2, t1, a0  # a2 <= t1 * a0

• div{u} a3, t2, a1 # a3 <= t2 / a1

• rem{u} a4, t3, a2 # a4 <= t3 % a2</pre>
```

**OBS**: Sufixo {u} deve ser usado para realizar operação de divisão/resto com números sem sinal (unsigned).

### Instruções: Operações Aritméticas

Operações aritméticas com imediatos

• Imediatos: constantes codificadas diretamente na instrução

Formato: <MNE>i rd, rs1, imm

addi a0, a2, 10 # a0 <= a2 + 10</pre>

**OBS**: Não existe a instrução subi, entretanto, é possível usar uma constante negativa para subtrair valores. Ex:

• addi a0, a2, -10 # a0 <= a2 - 10

Instruções para copiar valores da memória p/ registradores.

```
Formato: <MNE> rd, imm(rs1)

• lw a0, imm(a2) # a0 <= Mem[a2+imm]

• lh a0, imm(a2) # a0 <= Mem[a2+imm]

• lhu a0, imm(a2) # a0 <= Mem[a2+imm]

• lbu a0, imm(a2) # a0 <= Mem[a2+imm]

• lbu a0, imm(a2) # a0 <= Mem[a2+imm]

• lbu a0, imm(a2) # a0 <= Mem[a2+imm]
```

Instruções de <u>load</u> (l) carregam dados da memória para registradores. O sufixo (w, h, hu, b, bu) indica o <u>tipo de dado!</u>

#### Load word

• lw a0, imm(a2) # a0 <= Mem[a2+imm]</pre>

Carrega um número de 32 bits (4 bytes) da memória.

Formato *little-endian*: O *byte* menos significativo é carregado do endereço a2+imm enquanto que o *byte* mais significativo é carregado do endereço a2+imm+3.



Endereço

de memória



#### Load byte unsigned

zeros.

• lbu a0, imm(a2) # a0 <= Mem[a2+imm]

Carrega um número de 8 *bits* **sem sinal** (1 *byte*) da memória. Como o registrador tem 32 *bits*, o restante é preenchido com

Registradores lbu a0, 0(a2) 00 **80** Memória **08** 0E 0A 00 40 a2 8000 8001 8002 8003 8000

Endereço

de memória

# Load byte unsigned • lbu a0, imm(a2) # a0 <= Mem[a2+imm] Carrega v lbu dove sor usada quando da memória.

Como o zeros.

1bu deve ser usada quando carregarmos dados do tipo "unsigned char" da memória!

da memória. enchido com

Endereço



Endereço

de memória

#### Load byte

• lb a0, imm(a2) # a0 <= Mem[a2+imm]

Carrega um número de 8 bits com sinal (1 byte) da memória.

Como o registrador tem 32 *bits*, o restante é preenchido com 0's caso o número seja positivo ou com 1's (caso seja negativo).



## Load byte • lb a0, imm(a2) # a0 <= Mem[a2+imm]

Carrega um número de 8 bits com sinal (1 byte) da memória.

Como o registrador tem 32 *bits*, o restante é preenchido com 0's caso o número seja positivo ou com 1's (caso seja negativo).





#### Load halfword unsigned

• lhu a0, imm(a2) # a0 <= Mem[a2+imm]

Carrega um número de 16 bits sem sinal (2 bytes) da memória.

Como o registrador tem 32 *bits*, o restante é preenchido com zeros.



Endereço

de memória

# Load halfword unsigned • lhu a0, imm(a2) # a0 <= Mem[a2+imm]</pre>

Carrega u memória.

Como o i zeros.

**08** 

8000

Memória

8001

0E

8002

0A

8003

1hu deve ser usada quando carregarmos dados do tipo "unsigned short" da memória!

lhu a0, 0(a2)



Endereço

da

hido com

Endereço

de memória

#### Load halfword

• 1h a0, imm(a2) # a0 <= Mem[a2+imm]

Carrega um número de 16 bits com sinal (2 bytes) da memória.

Como o registrador tem 32 *bits*, o restante é preenchido com 0's caso o número seja positivo ou com 1's (caso seja negativo).



#### Load halfword

• lh a0, imm(a2) # a0 <= Mem[a2+imm]</pre>

Carrega um memória.

Como o re 0's caso o r 1h deve ser usada quando carregarmos dados do tipo "short" da memória!

chido com ja negativo).

da

Endereço

de memória



Instruções para copiar valores de registradores p/ memória.

```
Formato: <MNE> rd, imm(rs1) Endereço de memória

sw a0, imm(a2) # Mem[a2+imm] <= a0

sh a0, imm(a2) # Mem[a2+imm] <= a0

sb a0, imm(a2) # Mem[a2+imm] <= a0
```

Instruções de <u>store</u> (I) armazenam dados de registradores na memória. O sufixo (w, h, b) indica o <u>tipo de dado!</u>

Endereço

de memória

#### Store word

• sw a0, imm(a2) # Mem[a2+imm] <= a0

Grava um número de 32 bits (4 bytes) na memória.

Formato *little-endian*: O *byte* menos significativo é gravado no endereço a2+imm enquanto que o *byte* mais significativo é gravado no endereço a2+imm+3.



#### Endereço Store word de memória a0, imm(a2) # Mem[a2+imm] <= a0SW Grav sw deve ser usada quando gravarmos Form do no dados do tipo "int" ou "unsigned int" ende na memória! grava Registradores sw a0, 0(a2)**0A** Memor 40 a2 8000 8001 8002 8003 8000

Endereço

de memória

#### Store half word

• sh a0, imm(a2) # Mem[a2+imm] <= a0

Grava um número de 16 bits (2 bytes) na memória.

Formato *little-endian*: O *byte* menos significativo é gravado no endereço a2+imm enquanto que o *byte* mais significativo é gravado no endereço a2+imm+1.



Endereço

de memória

#### Store half word

• sh a0, imm(a2) # Mem[a2+imm] <= a0

Grava formation endere

gravad

sh deve ser usada quando gravarmos dados do tipo "short" ou "unsigned short" na memória!

gravado no cativo é



Endereço

de memória

#### Store byte

• sb a0, imm(a2) # Mem[a2+imm] <= a0

Grava um número de 8 bits (1 byte) na memória.

Formato *little-endian*: O *byte* menos significativo é gravado no endereço a2+imm.





8000

O fluxo normal de execução consiste em executar instruções uma após a outra na mesma ordem em que elas são organizadas na memória.

Instruções de controle de fluxo são instruções capazes de mudar o fluxo normal de execução.

#### Exemplo:

```
beq a0, a2, next_item
add a0, a0, a1
next_item:
sub a0, s1, 1
```

Instruções de controle de fluxo condicionais são instruções que mudam o fluxo normal de execução apenas sob certas condições.

#### Exemplo:

```
beq a0, a2, next_item
add a0, a0, a1
next_item:
sub a0, s1, 1
```

No caso acima, a instrução brach equal (beq) só "salta" (desvia o fluxo de execução) para o rótulo next\_item se o valor em a0 for igual ao valor em a2.

#### Instruções de controle de fluxo condicionais

```
Formato: <MNE> rs1, rs2, rot

• beq a0, a2, L # Salta se a0 = a2

• bne a0, a2, L # Salta se a0 != a2

• blt a0, a2, L # Salta se a0 < a2

• bge a0, a2, L # Salta se a0 >= a2

• bltu a0, a2, L # Salta se a0 >= a2

• bltu a0, a2, L # Salta se a0 <* a2</pre>
• bgeu a0, a2, L # Salta se a0 >=* a2
```

\* Comparação sem sinal!

Instruções de controle de fluxo incondicionais são instruções que sempre mudam o fluxo normal de execução.

```
jal foo
    add a0, a0, a1
    ...
foo:
    sub a0, s1, 1
```

No caso acima, a instrução jump and link (jal) salta para o rótulo foo e a próxima instrução a ser executada é a instrução sub.

#### Instruções de controle de fluxo incondicionais

```
Formato: <MNE> rd, rot
jal a0, L # "Faz o link" e salta p/ L
```

- Grava PC+4 em a0 e depois salta p/ o rótulo L
- PC+4 é o endereço da instrução subsequente à instrução sendo executada (jal)
- jal é utilizada para invocar rotinas. PC+4 é o local para onde o fluxo deve retornar após a execução da rotina

#### Instruções de controle de fluxo incondicionais

Invocando rotinas com jal

```
3000 jal ra, foo  # Invoca foo
3004 sub a3, a1, a0
3000 foo:  # Função foo
3000 add a0, a0, a1
3004 jalr x0, ra, 0 # Retorna de foo
```

#### Instruções de controle de fluxo incondicionais

Invocando rotinas com jal

Grava 8004 (PC+4) no registrador ra e salta para foo (9000)

```
8000 jal ra, foo # Invoca foo

8004 sub a3, a1, a0

...

9000 foo: # Função foo

9000 add a0, a0, a1

9004 jalr x0, ra, 0 # Retorna de foo
```

#### Instruções de controle de fluxo incondicionais

```
Formato: <MNE> rd, rs1, imm

jalr a0, a1, 0 # "Faz o link" e salta p/ a1+0
```

- Grava PC+4 em a0 e depois salta p/ al+0
- PC+4 é o endereço da instrução subsequente à instrução sendo executada (jalr)
- jalr é geralmente utilizada para retornar de rotinas saltando para o endereço de retorno que foi armazenado em um registrador pela instrução jal.

Instruções de controle de fluxo incondicionais

Retornando de rotinas com jalr

jal grava 8004 (PC+4) no registrador ra e salta para foo (9000)

```
8000 jal ra, foo # Invoca foo

8004 sub a3, a1, a0

...

9000 foo: # Função foo

9000 add a0, a0, a1

9004 jalr x0, ra, 0 # Retorna de foo
```

Salta para o endereço 8004 (armazenado em ra)

Instruções de controle de fluxo incondicionais

Retornando de rotinas com jalr

jal grava 8004 (PC+4) no registrador ra e salta para foo (9000)

```
### 100 (7000)

8000 jal ra, foo # Invoca foo

8004 sub a3, a1, a0

Endereço 9008 (PC+4) é

descartado (escrita no reg. x0)

9000 add a0, a0

jalr x0, ra, 0 # Retorna de foo
```

Salta para o endereço 8004 (armazenado em ra)

Instruções de salto direto vs salto indireto

**Salto direto**: o endereço alvo está codificado na própria instrução.

• Ex: jal ra, foo #Salta p/ foo

**Salto indireto**: o endereço alvo é computado a partir de um valor que está em um registrador de propósito geral.

• Ex: jalr x0, ra, 0 # Salta p/ ra+0

#### Invocar o sistema operacional

```
ecall # Invoca o sistema operacional
```

#### Exemplo - Chamando a chamada de sistema (syscall) write:

```
.data
msg: .asciz "Assembly rocks" # String

.text
_start:
li a0, 1  # a0: File descriptor = 1 (stdout)
la a1, msg # a1: endereço do buffer msg
li a2, 14  # a2: tamanho do buffer msg (14 bytes)
li a7, 64  # Código da chamada (write = 64)
ecall  # Invocar o SO
```

### Instruções: Comparação de Valores

Instruções que realizam comparações de valores e gravam o resultado em um registrador.

```
Formato: <MNE> rd, rs1, rs2

• slt a0, a2, t2 # a0=(a2<t2)?1:0

• sltu a1, t3, a0 # a1=(t3<a0)?1:0
```

Formato: <MNE>i rd, rs1, imm

- slti a0, a2, 10 # a0=(a2<10)?1:0
- sltui a1, t3, 25 # a1=(t3<25)?1:0

OBS: Sufixo u e ui indicam comparação sem sinal (<u>u</u>nsigned)

### Codificação das instruções RV32

Cada instrução é codificada com 32 *bits*, em um dos seguintes formatos

|   | 31                    | 27        | 26  | 25   | 24 | 20  | 19  | 15 | 14  | 12  | 11    | 7       | 6    | 0   |
|---|-----------------------|-----------|-----|------|----|-----|-----|----|-----|-----|-------|---------|------|-----|
| R |                       | funct7    |     |      |    | rs2 | rs1 |    | fun | ct3 | r     | d       | opco | ode |
| I |                       | in        | nm[ | 11:0 | )] |     | rs1 |    | fun | ct3 | r     | d       | opco | ode |
| S |                       | imm[11:5  | 5]  |      |    | rs2 | rs1 |    | fun | ct3 | imm   | [4:0]   | opco | ode |
| В | j                     | imm[12 10 | :5] |      |    | rs2 | rs1 |    | fun | ct3 | imm[4 | 4:1 11] | opco | ode |
| U | L J                   |           |     |      |    |     |     |    | r   | d   | opco  | ode     |      |     |
| J | imm[20 10:1 11 19:12] |           |     |      |    |     |     |    | r   | d   | opco  | ode     |      |     |

```
R: sll, srl, sra, add, sub, xor, or, and, slt, sltu
I: slli, srli, srai, addi, xori, ori, andi, slti, sltiu,
jalr, lw, lh, lb
```

U: lui, auipc

B: beq, bne, blt, bge, bltu, bgeu

J: jal

S: sw, sh, sb

### Codificação das instruções RV32

Cada instrução é codificada com 32 *bits*, em um dos seguintes formatos

| _ | 31                    | 27                       | 26  | 25   | 24 | 20  | 19  | 15 | 14   | 12  | 11     | 7       | 6    | 0           |
|---|-----------------------|--------------------------|-----|------|----|-----|-----|----|------|-----|--------|---------|------|-------------|
| R |                       | $\operatorname{funct} 7$ |     |      |    | rs2 | rs1 |    | func | ct3 | r      | d       | opco | $_{ m ode}$ |
| I |                       | in                       | nm[ | 11:0 | ]  |     | rs1 |    | func | ct3 | r      | d       | opco | ode         |
| S |                       | imm[11:5]                | 5]  |      |    | rs2 | rs1 |    | func | ct3 | imm    | [4:0]   | opco | ode         |
| В | i                     | mm[12 10]                | :5] |      |    | rs2 | rs1 |    | func | ct3 | imm[4] | 4:1 11] | opco | ode         |
| U | imm[31:12]            |                          |     |      |    |     |     |    |      | r   | d      | opco    | ode  |             |
| J | imm[20 10:1 11 19:12] |                          |     |      |    |     |     |    | r    | d   | opco   | ode     |      |             |

add rd, rs1, rs2

$$x[rd] = x[rs1] + x[rs2]$$

Add. R-type, RV32I and RV64I.

Adiciona o registrador x[rs2] ao registrador x[rs1] e grava o resultado em x[rd]. O overflow aritmético é ignorado.

Formas comprimidas: c.add rd, rs2; c.mv rd, rs2

| 31 | 25      | N 174 - 71 | ) 19 15 | 5 14 12 | '  | 6 0     |
|----|---------|------------|---------|---------|----|---------|
|    | 0000000 | rs2        | rs1     | 000     | rd | 0110011 |

### Codificação das instruções RV32

Cada instrução é codificada com 32 *bits*, em um dos seguintes formatos

|   | 31                    | 27               | 26  | 25   | 24 | 20  | 19  | 15 | 14  | 12   | 11     | 7            | 6    | 0           |
|---|-----------------------|------------------|-----|------|----|-----|-----|----|-----|------|--------|--------------|------|-------------|
| R |                       | funct7           |     |      |    | rs2 | rs1 |    | fun | ct3  | r      | d            | opco | $_{ m ode}$ |
| Ι |                       | in               | nm[ | 11:0 | )] |     | rs1 |    | fun | ct3  | r      | $\mathrm{d}$ | opco | $_{ m de}$  |
| S |                       | imm[11:5]        | 5]  |      |    | rs2 | rs1 |    | fun | ct3  | imm    | [4:0]        | opco | $_{ m de}$  |
| В | i                     | imm[12 10:5] rs2 |     |      |    |     | rs1 |    | fun | ct3  | imm[4] | 1:1 11]      | opco | ode         |
| U | imm[31:12]            |                  |     |      |    |     |     | r  | d   | opco | ode    |              |      |             |
| J | imm[20 10:1 11 19:12] |                  |     |      |    |     |     |    | r   | d    | opco   | ode          |      |             |

addi rd, rs1, immediate

x[rd] = x[rs1] + sext(immediate)

Add Immediate. I-type, RV32I and RV64I.

Adiciona o *valor imediato* de sinal estendido ao registrador x[rs1] e escreve o resultado em x[rd]. O overflow aritmético é ignorado.

Formas comprimidas: c.li rd, imm; c.addi rd, imm; c.addi16sp imm; c.addi4spn rd, imm

| 31              | 20 19 1 | 5 14 12 | 2 11 7 | 7 6 0   |
|-----------------|---------|---------|--------|---------|
| immediate[11:0] | rs1     | 000     | rd     | 0010011 |

### Limitações dos operandos imediatos

Formato I: slli, srli, srai, addi, xori, ori, andi, slti, sltiu, jalr



Campo de imediato (imm) é codificado na instrução com apenas 12 bits.

Valores válidos: -2048:2047

Formatos U e J: imm tem 20 bits

### Limitações dos operandos imediatos

Ao tentar montar um programa que contenha imediatos que não podem ser codificados, o montador reclama.

Ex: Programa prog.s com as seguintes instruções

```
addi a0, a5, 2048
addi a0, a5, 10000
addi a0, a5, -3000
```

```
$ as prog.s -o prog.o
prog.s: Assembler messages:
prog.s:1: Error: illegal operands `addi a0,a5,2048'
prog.s:2: Error: illegal operands `addi a0,a5,10000'
prog.s:3: Error: illegal operands `addi a0,a5,-3000'
```

#### Pseudo-instruções

Pseudo-instruções são instruções que existem na linguagem de montagem mas não existem na arquitetura do conjunto de instruções do processador.

O montador mapeia pseudo-instruções em instruções do processador. Ex:

nop

É uma pseudo-instrução mapeada em:

addi x0, x0, 0

Pseudo-instrução: mv rd, rs

- Exemplo: mv a0, a1
- Copia o valor do registrador fonte (rs) para o registrador destino (rd)

mv a0, a1 Montador addi a0, a1, 0

Pseudo-instrução: l{w|h|hu|b|bu} rd, rotulo

- Exemplo: lw a0, var\_x
- Carrega um valor da memória usando como endereço um rótulo.
- Rótulos representam endereços de 32 bits, que não podem ser codificados em um campo de uma instrução de 32 bits. Esta pseudo-instrução é expandida pelo montador em 2 instruções. Ex:

```
lw a0, var_x auipc a0, var_x[31:12]

lw a0, var_x [11:0],(a0)

logicality os de var_x

lw a0, var_x[11:0],(a0)

logicality os de var_x
```

Pseudo-instrução:  $s\{w \mid h \mid b\}$  rd, rotulo, rs

- Exemplo: sw a0, var x, t1
- Grava o valor de a0 na memória usando como endereço um rótulo (o segundo registrador é usado como temporário).
- Esta pseudo-instrução é expandida pelo montador em 2 pseudo-instruções. Ex:

```
sw a0, var_x, t1 Montador

sw a0, var_x, t1 Montador

sw a0, var_x[31:12]

sw a0, var_x[11:0](t1)

12 bits menos

significativos de var_x
```

Pseudo-instrução: la rd, rotulo

- Exemplo: la a0, var\_x
- Grava no registrador o endereço do rótulo.
- Rótulos representam endereços de 32 bits, que não podem ser codificados em um campo de uma instrução de 32 bits. Esta pseudo-instrução é expandida pelo montador em 2 pseudo-instruções. Ex:

```
la a0, var_x

auipc a0, var_x[31:12]

addi a0, a0, var_x[11:0]

I2 bits menos
significativos de var_x
```

Pseudo-instrução: li rd, imediato

- **Exemplo**: li a0, 1969
- Carrega um valor de até 32 bits no registrador rd.
- Valores pequenos (que podem ser representados com poucos bits) podem ser carregados com uma única instrução (addi) enquanto que valores grandes (que precisam ser codificados com muitos bits) podem exigir 2 instruções.

```
li a0, 1000 Montador addi a0, x0, 1000

li a0, 10000 Montador addi a0, 0x2 \frac{1}{0}0x2 = \frac{10[31:12]}{12}0x1 addi a0, \frac{1}{0}0x2 = \frac{10[31:12]}{12}0x2 = \frac{1}{0}1x1 a0, \frac{1}{0}2x2 = \frac{1}{0}3x1 and \frac{1}{0}3x2 = \frac{1}{0}3x1 and \frac{1}{0}3x1 and \frac{1}{0}4x2 = \frac{1}{0}4x3 and \frac{1}{0}4x3 and \frac{1}{0}4x3 and \frac{1}{0}4x4 and
```

#### Pseudo-instruções: Controle de fluxo

Pseudo-instrução: ret

• Retorna de função

jal grava 8004 (PC+4) no registrador ra e salta para foo (9000)

```
8000 jal ra, foo # Invoca foo

8004 sub a3, a1, a0

...

9000 foo: # Função foo

9000 add a0, a0, a1

9004 ret # Retorna de foo
```

"ret" é uma

pseudo-instrução para

"jalr x0, x1, 0"

#### Pseudo-instruções: Outras

#### Outras Pseudo-instruções do RISC-V

| nop             | addi x0, x0, 0     | Operação No                    |
|-----------------|--------------------|--------------------------------|
| neg rd, rs      | sub rd, x0, rs     | Complemento de dois            |
| negw rd, rs     | subw rd, x0, rs    | Palavra em complemento de dois |
| snez rd, rs     | sltu rd, x0, rs    | "Seta" se ≠ zero               |
| sltz rd, rs     | slt rd, rs, x0     | "Seta" se < zero               |
| sgtz rd, rs     | slt rd, x0, rs     | "Seta" se > zero               |
| beqz rs, offset | beq rs, x0, offset | Desvia se $=$ zero             |
| bnez rs, offset | bne rs, x0, offset | Desvia se $\neq$ zero          |
| blez rs, offset | bge x0, rs, offset | Desvia se $\leq$ zero          |
| bgez rs, offset | bge rs, x0, offset | Desvia se $\geq$ zero          |
| bltz rs, offset | blt rs, x0, offset | Desvia se < zero               |
| bgtz rs, offset | blt x0, rs, offset | Desvia se > zero               |
| j offset        | jal x0, offset     | Pula                           |
| jr rs           | jalr x0, rs, 0     | Registrador de pulo            |
| ret             | jalr x0, x1, 0     | Retorna da sub-rotina          |

#### Pseudo-instruções: Outras

#### Outras Pseudo-instruções do RISC-V

| Pseudo-Instrução    | Instrução (ões) Base   | Significado                  |
|---------------------|------------------------|------------------------------|
| li rd, immediate    | Miríades de sequências | Load valor imediato          |
| mv rd, rs           | addi rd, rs, 0         | Copia registrador            |
| not rd, rs          | xori rd, rs, -1        | Complemento de um            |
| sext.w rd, rs       | addiw rd, rs, 0        | Estende o sinal da palavra   |
| seqz rd, rs         | sltiu rd, rs, 1        | "Seta" se = zero             |
| bgt rs, rt, offset  | blt rt, rs, offset     | Desvia se >                  |
| ble rs, rt, offset  | bge rt, rs, offset     | Desvia se ≤                  |
| bgtu rs, rt, offset | bltu rt, rs, offset    | Desvia se >, sem sinal       |
| bleu rs, rt, offset | bgeu rt, rs, offset    | Desvia se $\leq$ , sem sinal |
| jal offset          | jal x1, offset         | Pula e linka                 |
| jalr rs             | jalr x1, rs, 0         | Jump e linka o registrador   |

#### Detecção de overflow

Detecção de *overflow* em somas de valores na representação **sem sinal**.

Saltar para rótulo se houver overflow:

Indicar overflow em registrador

```
add a0, a1, a2 # somamos os valores
sltu t1, a0, a1 # t1 <= 1 se (a1+a2) < a1 (Overflow)
# do contrário, t1 <= 0
```

#### Detecção de overflow

Detecção de *overflow* em somas de valores na representação **com sinal**.

Saltar para rótulo se houver overflow:

A soma de valores de 64 bits (long long)

 Utilizaremos a notação a1: a0 para indicar que o par de registradores a1 e a0 armazena um número de 64 bits sendo que os 32 bits menos (mais) significativos estão em a0 (a1).

Desejamos somar dois números de 64 bits armazenados em a1:a0 e a3:a2 e armazenar o resultado em a5:a4.

Podemos somar desta forma?

```
add a4, a0, a2  # somamos a parte menos significativa add a5, a1, a3  # somamos a parte mais significativa
```

A soma de valores de 64 bits (long long)

 Utilizaremos a notação de registradores a1 e bits sendo que os 32 e estão em a0 (a1).

Não! Desta forma o Código não leva em consideração a propagação de "vai um" entre o bit 31 e o bit 32.

Desejamos somar dois núlcem a1:a0 e a3:a2 e armaze

resultado em a5:a4.

Podemos somar desta forr

```
add a4, a0, a2 # somamos a parte menos significativa add a5, a1, a3 # somamos a parte mais significativa
```

Ao somarmos a parte menos significativa, verificamos se houve *overflow* considerando a representação sem sinal. Caso positivo, adicionamos I à soma da parte mais significativa.

em a1:a0 e

armazenar o resultado em a5:a4.

Podemos son desta forma?

```
add a4, a0, a2 # somamos a parte menos significativa sltu t1, a4, a2 # t1 <= 1 se (a0+a2) < a2 (Overflow) # do contrário, t1 <= 0 add a5, a1, a3 # somamos a parte mais significativa add a5, t1, a5 # somamos o "vai um"
```

Exercício I: Mostre o código para somar dois valores de 64 bits armazenados na memória, identificados pelos rótulos x e y, e armazenar o resultado no rótulo z

- Dica I: Você pode carregar os valores da memória com a pseudo-instrução "lw rd, rotulo"
- Dica 2: Você pode carregar o valor armazenado na posição de memória rotulo+4 com a pseudo-instrução "lw rd, rotulo+4"
  - Exemplo:

```
x:
...
lw a0, x
lw a1, x+4
```

Exercício I: Mostre o código para somar dois valores de 64 bits armazenados na memória, identificados pelos rótulos x e y, e armazenar o resultado no rótulo z

```
# Carrega a parte menos sig. de x
lw a0, x
               # Carrega a parte menos sig. de y
lw a1, y
add a1, a0, a1 # Soma partes menos significativas
sltu t1, a1, a0 # computa o "vai um"
sw a1, z, a0 # Armazena resultado parcial em z
lw a0, x+4 # Carrega a parte mais sig. de x (x+4)
               # Carrega a parte mais sig. de y (x+4)
lw a1, y+4
add a1, a0, a1 # Soma partes mais significativas
add a1, a1, t1 # Adiciona o "vai um"
sw a1, z+4, a0 # Armazena resultado parcial em z+4
```